智能论文笔记

Is it worth it? An experimental comparison of six deep- and classical machine learning methods for unsupervised anomaly detection in time series

Ferdinand Rewicki , Joachim Denzler , Julia Niebling

分类：机器学习 | 人工智能

2022-12-21

The detection of anomalies in time series data is crucial in a wide range of applications, such as system monitoring, health care or cyber security. While the vast number of available methods makes selecting the right method for a certain application hard enough, different methods have different strengths, e.g. regarding the type of anomalies they are able to find. In this work, we compare six unsupervised anomaly detection methods with different complexities to answer the questions: Are the more complex methods usually performing better? And are there specific anomaly types that those method are tailored to? The comparison is done on the UCR anomaly archive, a recent benchmark dataset for anomaly detection. We compare the six methods by analyzing the experimental results on a dataset- and anomaly type level after tuning the necessary hyperparameter for each method. Additionally we examine the ability of individual methods to incorporate prior knowledge about the anomalies and analyse the differences of point-wise and sequence wise features. We show with broad experiments, that the classical machine learning methods show a superior performance compared to the deep learning methods across a wide range of anomaly types.

translated by 谷歌翻译

Tweet's popularity dynamics

Ferdinand Willemin

分类：机器学习

2023-01-02

This article charts the work of a 4 month project aimed at automatically identifying patterns of tweets popularity evolution using Machine Learning and Deep Learning techniques. To apprehend both the data and the extent of the problem, a straightforward clustering algorithm based on a point to point distance is used. Then, in an attempt to refine the algorithm, various analyses especially using feature extraction techniques are conducted. Although the algorithm eventually fails to automate such a task, this exercise raises a complex but necessary issue touching on the impact of virality on social networks.

translated by 谷歌翻译

MLT-LE: predicting drug-target binding affinity with multi-task residual neural networks

Elizaveta Vinogradova , Karina Pats , Ferdinand Molnár , Siamac Fazli

分类：机器学习

2022-09-13

评估药物目标亲和力是药物发现和开发过程中的关键一步，但是在实验上获得此类数据既耗时又昂贵。因此，正在广泛开发用于预测结合强度的计算方法。但是，这些方法通常使用单任务方法进行预测，因此忽略了可以从数据中提取并用于驱动学习过程的其他信息。此后，在这项工作中，我们提出了一种多任务方法来结合强度预测。我们的结果表明，这些预测确实可以通过使用相关任务和多任务诱导的正则化的添加信息来从多任务学习方法中受益。

translated by 谷歌翻译

A biologically-inspired evaluation of molecular generative machine learning

Elizaveta Vinogradova , Abay Artykbayev , Alisher Amanatay , Mukhamejan Karatayev , Maxim Mametkulov , Albina Li , Anuar Suleimenov , Abylay Salimzhanov , Karina Pats , Rustam Zhumagambetov

分类：机器学习 | 人工智能

2022-08-20

虽然最近在许多科学领域都变得无处不在，但对其评估的关注较少。对于分子生成模型，最先进的是孤立或与其输入有关的输出。但是，它们的生物学和功能特性（例如配体 - 靶标相互作用）尚未得到解决。在这项研究中，提出了一种新型的生物学启发的基准，用于评估分子生成模型。具体而言，设计了三个不同的参考数据集，并引入了与药物发现过程直接相关的一组指标。特别是我们提出了一个娱乐指标，将药物目标亲和力预测和分子对接应用作为评估生成产量的互补技术。虽然所有三个指标均在测试的生成模型中均表现出一致的结果，但对药物目标亲和力结合和分子对接分数进行了更详细的比较，表明单峰预测器可能会导致关于目标结合在分子水平和多模式方法的错误结论，而多模式的方法是错误的结论。因此优选。该框架的关键优点是，它通过明确关注配体 - 靶标相互作用，将先前的物理化学域知识纳入基准测试过程，从而创建了一种高效的工具，不仅用于评估分子生成型输出，而且还用于丰富富含分子生成的输出。一般而言，药物发现过程。

translated by 谷歌翻译

Quantum Circuit Compiler for a Shuttling-Based Trapped-Ion Quantum Computer

Fabian Kreppel , Christian Melzer , Janis Wagner , Janine Hilder , Ulrich Poschinger , Ferdinand Schmidt-Kaler , André Brinkmann

分类：自然语言处理

2022-07-05

量子计算硬件的功能增加，并实现深量子电路的挑战需要完全自动化和有效的工具来编译量子电路。要以一系列与特定量子计算机体系结构有关的天然大门表达任意电路，对于使算法在量子硬件提供商的整个景观中可移植。在这项工作中，我们提出了一个能够转换和优化量子电路的编译器，针对基于穿梭的捕获离子量子处理器。它由剑桥量子计算机的量子电路框架pytket上的自定义算法组成。评估了广泛的量子电路的性能，与标准Pytket相比，与标准Qiskit汇编相比，栅极计数可以降低到3.6倍，最高为2.2，而我们获得的栅极计数与相似的栅极计数相比相比，针对AQT线性静态捕获离子地址架构的Pytket扩展。

translated by 谷歌翻译

Optimizing Mixture of Experts using Dynamic Recompilations

Ferdinand Kossmann , Zhihao Jia , Alex Aiken

分类：机器学习

2022-05-04

专家架构的混合物可以通过独立于计算需求（FLOP）来扩展模型参数大小来实现极大的神经网络。但是，当前的DNN框架无法有效地支持专家混合物中的动态数据流，并且在这些框架之上的实现需要使用引入重要开销的解决方法。为了解决这些框架的限制，我们提出了Dynyoe，这是一个DNN库，它使用动态重新编译来优化和调整计算资源的使用，以适合专家模型混合的动态需求。我们的评估表明，与现有的MOE系统相比，Dynamoe达到了1.8倍的速度，并支持2.3倍的型号，即使不使用重新编译也是如此。然后，我们提出了通过动态重新补偿来实现进一步的优化，从而产生额外的1.7倍加速度，同时降低记忆压力并改善模型质量。

translated by 谷歌翻译

Learning Coulomb Diamonds in Large Quantum Dot Arrays

Oswin Krause , Anasua Chatterjee , Ferdinand Kuemmeth , Evert van Nieuwenburg

分类：机器学习

2022-05-03

我们介绍了一种能够在量子点阵列中找到库仑钻石的方面的算法。我们使用恒定相互作用模型模拟这些阵列，并仅依靠一维栅格扫描（射线）使用正则化最大似然估计来学习设备的模型。这使我们能够确定设备的给定电荷状态，过渡的存在以及它们的补偿门电压是什么。对于较小的设备，模拟器还可以用于计算库仑钻石的确切边界，我们用来评估我们的算法正确地找到了具有高精度的绝大多数过渡。

translated by 谷歌翻译

Privileged Attribution Constrained Deep Networks for Facial Expression Recognition

Jules Bonnard , Arnaud Dapogny , Ferdinand Dhombres , Kévin Bailly

分类：计算机视觉

2022-03-24

面部表达识别（FER）在许多研究领域至关重要，因为它使机器能够更好地理解人类的行为。 FER方法面临着相对较小的数据集和嘈杂数据的问题，这些数据不允许经典网络良好地概括。为了减轻这些问题，我们指导该模型专注于眼睛，嘴或眉毛等特定面部区域，我们认为这是决定面部表情的决定性的。我们提出了特权归因损失（PAL），该方法通过鼓励其归因图与面部标志形成的热图相对应，从而将模型的注意力引向最显着的面部区域。此外，我们引入了几种渠道策略，使该模型具有更高的自由度。所提出的方法独立于骨干体系结构，并且在测试时不需要其他语义信息。最后，实验结果表明，所提出的PAL方法的表现优于RAF-DB和Actionnet上的当前最新方法。

translated by 谷歌翻译

Modelling DDoS Attacks in IoT Networks using Machine Learning

Pheeha Machaka , Olasupo Ajayi , Hloniphani Maluleke , Ferdinand Kahenga , Antoine Bagula , Kyandoghere Kyamakya

分类：机器学习

2021-12-10

在当前的Internet-Internet-More（IoT）部署中，依赖于TCP协议的传统IP网络和IOT特定协议的组合可用于将数据从源传输到目标。因此，使用TCP SYN攻击的TCP特定攻击，例如使用TCP SYN攻击的分布式拒绝服务（DDOS）是攻击者可以在网络物理系统（CPS）上使用的最合理的工具之一。这可以通过从其IOT子系统启动攻击来完成，这里被称为“CPS-IOT”，其潜在的传播到位于雾中的不同服务器和CP的云基础架构。该研究比较了监督，无监督和半监控机器学习算法的有效性，用于检测CPS-IOT中的DDOS攻击，特别是在通过因特网到网络空间到网络空间的数据传输期间。所考虑的算法广泛地分为二：i）检测算法，其包括逻辑回归（LGR），K型和人工神经网络（ANN）。我们还研究了半监督混合学习模型的有效性，它使用无监督的K-means来标记数据，然后将输出馈送到攻击检测的监督学习模型。 II。）预测算法 - LGR，内核RIDGE回归（KRR）和支持向量回归（SVR），用于预测即将发生的攻击。进行实验试验并获得结果表明，杂交模型能够达到100％的精度，零误报;虽然所有预测模型都能够实现超过94％的攻击预测准确性。

translated by 谷歌翻译

General Cross-Architecture Distillation of Pretrained Language Models into Matrix Embeddings

Lukas Galke , Isabelle Cuber , Christoph Meyer , Henrik Ferdinand Nölscher , Angelina Sonderecker , Ansgar Scherp

分类：自然语言处理 | 机器学习

2021-09-17

大型的语言模型（PRELMS）正在彻底改变所有基准的自然语言处理。但是，它们的巨大尺寸对于小型实验室或移动设备上的部署而言是过分的。修剪和蒸馏等方法可减少模型尺寸，但通常保留相同的模型体系结构。相反，我们探索了蒸馏预告片中的更有效的架构，单词的持续乘法（CMOW），该构造将每个单词嵌入为矩阵，并使用矩阵乘法来编码序列。我们扩展了CMOW体系结构及其CMOW/CBOW-HYBRID变体，具有双向组件，以提供更具表现力的功能，在预绘制期间进行一般（任务无义的）蒸馏的单次表示，并提供了两种序列编码方案，可促进下游任务。句子对，例如句子相似性和自然语言推断。我们的基于矩阵的双向CMOW/CBOW-HYBRID模型在问题相似性和识别文本范围内的Distilbert具有竞争力，但仅使用参数数量的一半，并且在推理速度方面快三倍。除了情感分析任务SST-2和语言可接受性任务COLA外，我们匹配或超过ELMO的ELMO分数。但是，与以前的跨架结构蒸馏方法相比，我们证明了检测语言可接受性的分数增加了一倍。这表明基于基质的嵌入可用于将大型预赛提炼成竞争模型，并激励朝这个方向进行进一步的研究。

translated by 谷歌翻译